Diffusion による Text2Image の系譜と生成画像が動き出すまで - nobuoka-pub

Diffusion による Text2Image の系譜と生成画像が動き出すまで

https://speakerdeck.com/nhamanasu/diffusionniyorutext2imagenoxi-pu-tosheng-cheng-hua-xiang-gadong-kichu-sumade

Diffusion による Text2Image の系譜と生成画像が動き出すまで

著 : 清水遼平 (株式会社 DeNA)

キーワード : 画像生成 AI

前提知識

生成モデル

Diffusion 基礎

拡散モデル (Diffusion モデル) とは

Text2Image の系譜

自然言語と画像を同一特徴量空間で近づける

研究界隈の動き

Latent Diffusion Models (LDM)

Text2Image の知名度を上げた立役者

大衆化

OSS としての高品質 Text2Image の先駆け

Stable Diffusion : イラスト系の生成品質に優れる

Stable Diffusion web UI

Waifu Diffusion

ゲームチェンジャー

NovelAI Diffusion : イラスト調生成の金字塔

進化

NijiJourney : MidJourney の派生

HuggingFace、Civtai

日刊画像生成 AI

爆発的な普及による弊害と警鐘

著作権などの権利問題

Video Diffusion Models

#スライド #文献